查看原文
其他

信贷场景广告投放优化实践

王耀宣 DataFunSummit
2024-09-10

导读 广告投放,简单来讲就是在各个媒体平台推广产品。本文将分享奇富科技在信贷场景广告投放优化方面的实践经验。

主要内容包括以下四大部分:

1. 信贷广告投放业务介绍

2. 人群策略

3. 计划策略

4. 智能素材

分享嘉宾|王耀宣 奇富科技 算法总监 

内容校对|李瑶

出品社区|DataFun


01

信贷广告投放业务介绍

首先来介绍一下我们的业务场景和痛点。

在请求的阶段,媒体会给一次决策的机会,决策是否要这次曝光,以及愿意付出一个什么样的价格,媒体会通过提供一些工具辅助我们进行决策;在我们决策之后,媒体通过竞价机制判定本次出价是否能拿到这次曝光;当最终曝光展示之后,用户还会进行选择,即是否会点击这个素材、会不会到落地页、会不会申请;然后就进入产品的流程,信用贷款产品相对于传统产品不太一样的地方在于还会有一个授信的环节,即用户申请后不一定直接通过,而是先评判风险,根据风险情况给定额度,最终用户拿到了授信结果才会有后续的转化行为。以上就是完整的业务链路,可以看到这是一条非常长的链路。

在整个链路中有广告媒体、广告主和用户三个参与方,其诉求各不相同。用户的核心诉求是拿到一个更好的 offer,对于信贷场景而言,就是额度高、利率低,并且有比较好的用户体验;广告媒体的核心诉求是平台收益的最大化,在此期间也会尽可能地保障广告主的利益(比如成本和 ROI),以及保障整个生态的健康度,但最核心的诉求还是平台自身收益的最大化;广告主的核心诉求简单的讲就是提升投放的 ROI,希望在有限的预算情况下获得更多有效的用户增长,但实际上还要考虑多个方面,比如预算的限制、成本的限制、人群占比的限制,在这些限制条件下再去优化整个的规模或者 ROI,本质上是一个多约束优化的问题。

媒体会给广告主提供一些简单的工具,比如 DMP 人群包或 RTA 接口,这样广告主能够通过平台或接口的方式离线或实时地得到反馈,再作出决策。基于媒体的能力,我们内部也建设了人群策略、计划策略、素材创意等能力,接下来将分别进行介绍。

02

人群策略

1. 基本逻辑

媒体的请求给到我们时,我们会有一次决策机会,即是否曝光以及出价。该决策结果,会影响媒体侧的出价公式(ECPM 的公式里面的一个决策因子),并影响我们自己后续曝光的分布,从而影响后续的转化效率。

不同业务阶段的建模目标也是不同的,比如我们早期看重的是申请量,后面会更看重有效申请(授信量),在某一阶段(比如当前阶段)更看重的是长期 ROI。目标会随着整个业务的变化,有比较大的调整。业务目标制定完整之后,我们会基于业务目标构建后续的模型,然后再去构建更细粒度的策略,最终通过决策引擎影响到媒体的决策。简而言之就是我们要根据业务目标去构建前置的模型和策略,来把后面的所有决策链路前置到前端的出价环节。

2. 整体架构

基于上述逻辑,我们需要构建一整套平台能力,首先因为我们接入了很多大流量媒体,比如头条、腾讯、百度、快手等,每天大概有七八百亿的量级,所以对我们的服务的要求是比较高的。我们的核心是迭代模型和策略的能力,为了支撑这些能力,需要去构建很多基础设施,包括数据平台、建模平台,基于建好的模型还需要整合到变量平台,以支持决策平台,最终通过有效的实验平台去做 AB 分流,快速地迭代实验。

3. 模型&数据能力

我们业务要求实时地对全网用户(约几十亿的设备号)作决策,早期因为没有背靠流量平台,我们对用户没有较好的识别能力,所以需要采买一些第三方的数据产品。这些第三方的数据产品会有一些行业标准特征,在此基础上我们也会与其开展更深度的合作,比如做一些统计的挖掘、底层数据的 embedding 表达,以及一些端到端的建模能力。

同时我们也会构建自己内部的数据体系。在与外部数据商合作时,不仅会返回一些实时的模型分,还会构造一些事实类的画像特征(比如年龄、性别、收入),经过长期积累,就可以对我们自己的数据体系形成有效的补充。当然我们在跟媒体侧合作时,也会拿到大量的数据请求曝光,以及一系列的转化数据,这些信息也能通过一些特征表达,为模型(特别是响应类模型)带来非常大的提升。我们最终会在上层做简单的融合模型,尽可能地形成一些标准化、流程化的机制,以周期性地运行。

另一方面基于广告的请求曝光点击,以及端内收集到的行为数据构建一套完整的 ID Mapping 体系,通过设备间的关联信息,不仅能够提升设备的覆盖率,也能进一步丰富特征表达,最终为模型带来提升。

数据和模型的核心是构建底层的基础数据能力,上层再去做一些标准化,提高迭代效率,通过同时让模型效果和设备覆盖都有提升,最终对整个媒体流量识别率达到 95% 以上,这样在做决策时就能够有一个更强有力的支撑。

4. 策略能力

(1)数据基建

底层整个转化链路很长,包括请求、参竞、曝光、点击,以及一系列后链路的转化,我们通过数据生产把它们构建成全漏斗数据,这样为后期快速的策略迭代提供了基础数据支撑。

(2)差异化出价

差异化出价是指在每个请求来的时候,我们不仅可以决策要不要这个流量,还可以给出不同的出价系数。首先我们会通过小流量实验搜集各用户分层中在给出不同系数后的转化数据。整个转化漏斗非常长,对于一些前链路的转化(比如竞得力、CPM),因为数据量比较充分,我们会基于一些模型的方式做拟合;对于后链路的一些转化指标,由于数据量非常稀疏,往往需要通过一个更长周期的统计数据表达,因此我们更多采用整体统计的方式实现。基于此最终可以预估出不同的系数对应的转化结果,然后再通过自动寻优的方式,就能够得到最优的分配结果,以及各项业务指标的变化情况,用于指导决策。

03

计划策略

接下来介绍计划策略方面的能力建设。

1. 基本逻辑

在做广告投放时,会建很多广告主,进而是广告组、广告计划和广告创意。运营人员会创建万级别的广告计划,广告创意的量级会达到 10 万级别,每天的操作数也是上万级别,包括新建、提价、降价、关停等。另外,业务目标的调整非常频繁,需要快速反馈。因此我们期望通过整个数据驱动和模型预估的能力提升决策的精度和反馈的速度。

这部分策略更多的是在广告计划这一层级,目前主流的投放方式是 oCPX。广告计划投放之初会经历一个冷启动期,这一期间媒体侧会提供一些扶持,由于数据量比较稀疏,我们一般不会做过多干预。但当计划到了成熟期,我们就希望去进行一些干预来保障大盘的效果提升。

2. 成熟计划调控

运营同学会将计划划分为风险计划、优质计划、潜力计划和劣质计划四类,我们通过数据化的能力,将这些专家经验进行了总结,最终形成了一些自动化规则。但这部分策略只能依赖于历史表现,未来表现则需要通过模型预估。模型本身是基于未来时间窗叉乘上未来的表现(包括成本、量级)组合的 label 来构建的。但实际站在业务的角度,很难有单个模型能把所有 case 都覆盖到。所以一般会去做一些简单的划分,比如什么样的模型支持关停策略、以及怎么样定一些提价/降价的目标,当然也会构建更多的辅助模型和策略,包括可能会针对细分场景做回捞,通过这些细分的策略最终形成整体的策略。最终模型在线上取了非常好的表现。

另一方面,虽然模型的策略短期表现较好,但长期观测时会发现消费量级逐渐下降。所以我们会把模型策略叠加时间周期,形成一个模型加时间的二维决策。最终,对早期计划尽量放松管制,而后期计划则尽量做一些坚决的策略,这样可以达到更加理想的效果。

3. 计划新建

除了对成熟计划的调控之外,我们还需要新建计划,从而让整个投放持续下去。首先业务会做一些基础的计划新建能力,比如复用一些优质计划、优质素材。在这个过程中我们发现对整个计划影响最大的是素材,所以我们基于历史上表现优质的素材去建模,通过模型预估出优质素材再做复用。

这里解释一下为什么会去做这样的一些细分策略,因为我们在投放过程中发现,相同素材有的跑得很好,有的就跑不出来。核心原因就是因为整个媒体的候选集太多了,能否跑出来有非常强的偶然性。其中真正能跑出来的素材一定是好素材,但没有跑出来的不一定不是好素材。所以我们通过构建模型召回好的但没有跑出来的素材。并且后面基于相同思路也构建了一些其他能力,比如素材的相似召回、AIGC 裂变。这里提到的所有这些能力都依赖于广告素材预估的能力。

素材模型的底层依赖包括属性特征和投放特征。其中在构建属性特征时,我们利用了大模型的能力做一些素材的内容理解,比如对真人类素材的对话脚本做分析,通过语言模型做端到端的预估,当然也会抽取一些关键词作为标签,以及做一些端到端的表达、embedding 表达;另一方面,从老素材中能搜集到丰富的转化数据信息,用于形成素材预估的一些基础能力。

04

智能素材

1. 基础逻辑

我们主要的思路是通过一些大模型、AIGC 等能力进行快速裂变生产解决数量的问题,然后再通过模型预估解决质量的问题,两者相结合共同提升投放效果。

2. 图片素材

我们一开始期望通过多模态大模型去做图片素材生产,但后来发现要端到端地生产出能够投放的广告素材的难度非常大,所以我们把素材进行了拆解,形成一些标准化的模板。同时通过自己设计,以及依赖于文生图/图生图的能力,构建一套相对比较完善的元素库(候选集)。接下来就可以通过模板去做元素召回,最终形成一个标准化的素材合成的生产能力。

在生成素材之后,我们还会对素材做一些 AI 打标,再往后就是通过模型的素材预估,最终影响整个投放的策略。我们还会构建一套基于效果的迭代体系,尽可能让效果转换数据反馈到标签体系和元素上,以不断地调整生产的配比,最终带来业务效果的提升。

3. 视频素材

对于视频素材,我们迭代了很多版本,之前更多是在做一些基础能力的建设,比如智能换脸、智能换衣等能力的探索。现阶段我们期望把大量的成品素材利用上,依赖成品素材做裂变,以解决量的问题。核心思路是通过 ASR/OCR 的技术拆成带时间戳的脚本,然后通过语义分析对语料拆分后构建视频库,最终形成生产的标准化流程。

在这个过程中我们也探索了一些视频生产能力,我们会用文生图的方式去生产一些猎奇类的首贴,同时也尝试了一些 AIGC 视频的生产能力。在去年 11 月份,通过 SVD 开源的模型技术报告,我们尝试构造一些适应于自己业务场景的视频片段后做了模型的 finetune,再通过一些图生视频的方式构建了一些很短的视频前贴,最终在线上投放获得了很好的效果。

以上就是本次分享的内容,谢谢大家。


分享嘉宾

INTRODUCTION


王耀宣

奇富科技

算法总监

互联网广告和互联网金融领域十余年算法研发和应用经验,先后在秒针系统、百度、阿里等公司从事广告、获客、经营等方向的模型算法和智能决策系统能力建设。现负责奇富科技投放获客、用户经营等相关业务算法和图像、语音等多模态相关基础算法方向,致力于模型算法对业务的高效赋能。

往期推荐


DataFunCon 2024·北京站首日圆满收官

数据指标在金融行业的应用

【参会攻略】DataFunCon 北京站开幕倒计时 2 天!直播预约、幻灯片免费下载……

全球化视野下,多云数据架构如何应对出海挑战?

京东零售数据湖应用与实践

辛选集团数据建设历程以及数据在直播电商的应用

实时智能全托管-云器Lakehouse重新定义多维数据分析

优化数据管理效率:DataFun助力企业提升竞争力

通义灵码智能编码助手技术解密

要跟 Spark PK,新一代计算加速引擎 Meson 的底气来自哪里?

点个在看你最好看

SPRING HAS ARRIVED

继续滑动看下一个
DataFunSummit
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存